今天的文章內容會對機器學習的類型進行大致介紹,現在有不少非這兩大類的類型,如強化學習等等,但我們先專注在這兩大類上,為大家做介紹。
需要人力對樣本進行標記,給於標籤,對於每個樣本有明確的答案,即屬此類。
此類有兩個子類別,以給出預測的值為標準做出分類。
分類 Classification
預測給定的樣本屬於哪個類別,做出的預測是概率值,針對概率值的高低給出所屬類別的真假預測,之後預測手寫數字與物件圖片的皆屬此類。
回歸 Regression
對給定的樣本給出一個連續值,Keras裡有帶了一個資料集boston_housing,波士頓的房屋資料,裡面有附近的犯罪率、屋齡、臥室數量等等,要預測的是房子的房價,預測房價、股價這種連續的值即是回歸。
一般不對樣本標記,或只對一小部分樣本標記,對於絕大多數樣本並沒有一個標準答案,目前發展相較非監督式學習來說並不多。
聚類 Cluster
將一大堆資料分群,是非監督式學習最主要的應用,例如新聞或廣告等等,你看了一些新聞或產品後,系統將類似的內容推薦給你,過程中所使用的是就是聚類,k-means是一個很有名的聚類演算法。